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摘 要 : 棉花 是 中 国 重 要 的 经 济 作物 ,在 新 疆 大 


积 种 植 。 及 时 准确 获取 棉花 种 植 鱼 


A aT AK MY BK 


策 制 定 与 农业 经 济 发 展 有 重要 意义 。 以 渭 干 河 一 库 车 河 三 角 洲 绿洲 棉花 为 主要 研究 对 象 AA 
2018 一 2020 年 (1 景 /1 月 )36 景 哨兵 2 号 (Sentinel-2) 数 据 , 构 建 归 一 化 植被 指数 (Normalize differ- 


ence vegetation index,NDVI) 和 红 边 归 一 化 植被 


# 2 (Red edge normalize difference vegetation index, 


RENDVILs) 时 序数 据 ; 采 用 Savitzky-Golay(S-G) 滤 波 法 对 时 序数 据 进 行 平滑 、 重 构 并 提取 11 个 物候 
特征 ;利用 袋 外 误差 法 对 11 个 物候 特征 进行 特征 优选 ;在 此 基础 上 利用 重 构 后 的 时 序数 据 (NDVI 


Fit) (RENDVJLs Fit) 、 物 候 特 征 (RENDVLs Ph)、 


物候 特征 优选 组 合 构建 6 种 不 同 的 特征 数据 集 , 利 


用 随机 和 森林 分 类 (RFC) 方 法 分 别 进行 分 类 和 提取 ,并 采用 最 大 似 然 分 类 方法 和 支持 向 量 机 分 类 方 
法 对 分 类 效果 进行 验证 。 结 果 表 明 :(1)NDVI 和 RENDVL。 时 序数 据 变化 趋势 较为 一 致 ,棉花 在 5 


月 ( 苗 期 ) 到 8 月 初 ( 


花 盛 期 ) 有 明显 的 上 升 趋势 ,在 8 月 未 至 9 月 ( 花 铃 期 ) 达 到 峰值 。 相 比 NDVT， 


红 边 波段 构成 的 RENDVLss 时 序曲 线 峰 值 从 0.7 提 高 到 0.9 ,棉花 区 分 效果 更 佳 。(2) 11 个 物候 特征 
中 拟 合 函数 最 大 值 、 生 长 季 长 度 、 生 长 季 振 幅 、 生 长 季 结 来 、 生 长 季 大 积分 和 生长 季 小 积分 对 分 类 
的 贡献 性 最 大 ,重要 性 得 分 分 别 为 1.43、1.40、1.23、1.16、1.02 和 1.01,(3) RFC 方 法 对 特征 数据 集 
(RENDVLs Fit+ 物候 特 征 优选 组 合 ) 分 类 精度 最 佳 。 总 体 精 度 和 Kappa 系数 分 别 为 92.20% 和 和 


0.92。(4) 研究 区 内 棉花 分 类 精度 达到 了 91.02% , 4 78 T 


24.67%。 
关键 i: 
文章 编号 : 


棉花 作为 重要 的 经 济 作物 ,在 新 疆 地 区 广泛 种 

植 。2014 年 以 来 ,我 国 在 新 疆 实 施 棉 花 目 标价 格 改 
革 , 对 疆 内 各 地 区 棉花 播种 面积 .结构 分布 产 生 较 
影响 "。 由 于 新 疆 环 塔里木 林果业 的 迅速 发 展 ， 
果树 和 棉花 等 作物 种 植 模式 越 来 越 复杂 ,传统 的 监 
测 方 法 无 法 满足 大 尺度 、 复 杂 地 理 环境 下 快速 、 高 
精度 的 棉花 识别 与 面积 监测 的 迫切 需求 ”。 因 此 ， 
继续 开展 棉花 高 精度 识别 和 信息 提取 等 研究 仍 有 
植被 物候 是 指 植被 发 芽 .叶片 草 延 、 抽 穗 成熟 


收 稿 日 期 : 2022-03-23; 修订 日 期 : 2022-05-16 


积 约 为 3424 km , 占 研究 区 总 面积 的 


NDVI 时 间 序 列 ; RENDVI 时 间 序 列 ; 物候 特征 ; 袋 外 误差 ， 随 机 森林 分 类 
1000 - 6060(2022)06 - 1847 - 13(1847 ~ 1859) 


和 脱落 的 周期 性 变化 ,能够 反映 生长 规律 ,不 同 作 
物 具 有 不 同 的 物候 特征 。 因 此 ,可 以 将 这 些 物候 
特征 进行 量化 分 类 。 通 感 技 术 的 发 展 为 大 面积 提 
取 农 作物 物候 特征 提供 了 有 效 的 技术 途径 。 国 内 
外 很 多 学 者 利用 多 时 相 Landsat TM , MODIS 等 
中 、 低 分 状 率 数据 的 归 一 化 植被 指数 (Normalize dif- 
ference vegetation index, NDVI) 或 增强 植被 指数 (En- 
hanced vegetation index,EVT) 获 取 作 物 的 生长 发 育 期 
变化 ,提取 物候 信息 ,进行 农作物 识别 与 分 类 "”。 这 
些 影像 数据 具有 高 时 间 分 辨 率 、 获 取 方 便 与 低 成 本 
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等 优势 应 用 于 地 表 植 被 的 生长 监测 和 识别 ,对 种 植 
结构 单一 的 作物 具有 很 大 的 优势 。 但 是 这 些 影 
像 数 据 混合 像 元 量 众多 ,光谱 辨识 率 有 限 ,而 且 使 
用 的 特征 变量 往往 比较 单一 ,因此 ,在 地 块 破碎 、 作 
物 生 长 周期 相近 光谱 差异 小 的 情况 下 很 难 对 其 进 
行 有 效 的 区 分 ,无 法 满足 大 范围 .复杂 地 形 条 件 下 
的 棉花 空间 分 布 监测 精度 要 求 "。 

欧洲 航天 局 Sentinel-2 卫星 ,共有 13 个 波段 , 空 
间 分 辨 可 达 10 m, LG MODIS .Landsat-8 相 比 在 705~ 
865 nm 特有 3 个 红 边 波段 ", 为 红 边 波段 作物 遥感 
监测 提供 了 数据 保障 ,解决 了 棉花 种 植 面 积 监 测 中 
精度 与 成 本 相互 制约 的 问题 。 国 内 外 已 有 很 多 学 
者 通过 Sentinel-2 数 据 探讨 了 农业 监测 中、 土地 利用 
分 类 ”作物 分 类 及 面积 提取 ”中 的 应 用 并 证 实 了 
红 边 参数 波段 对 监测 植被 健康 和 长 势 的 有 效 性 ”。 

渭 干 河 一 库 车 河 三 角 洲 绿洲 (简称 渭 一 库 绿 
洲 ) 是 塔里木 河流 域 开 蚂 较 早 并 在 西北 干旱 区 具有 
代表 性 的 绿洲 。 以 灌溉 农业 为 主 ,耕地 不 断 向 绿洲 
外 围 扩张 ,种 植 地 块 较为 细碎 。 棉 花 、 玉 米 .果树 等 
生长 周期 相似 的 秋季 作物 套种 模式 复杂 。 因 此 需 
要 开展 基于 高 分 辨 率 数 据 的 棉花 识别 特征 和 分 类 
方法 的 探索 。 因 此 ,本 人 研究 利用 36 期 多 时 相 Senti- 
nel-2 数 据 , 在 已 有 有 NDVI 时序 数据 的 遥感 监测 基础 
上 结合 改进 的 红 边 归 一 化 植被 指数 (Red edge nor- 
malize difference vegetation index , RENDVls) 时 序数 
JE , AIH Savitzky-Golay (S-G ) 滤 波 算 法 对 其 进行 平 
滑 和 重 构 ,提取 11 个 关键 性 物候 特征 并 其 进行 特征 
重要 性 评价 ,构建 不 同 的 分 类 特征 数据 集 ,用 随机 
森林 分 类 (RFC) 方 法 进行 分 类 和 棉花 种 植 面积 所 
取 。 为 农业 部 门 对 棉花 种 植 面积 监测 提供 重要 的 
参考 依据 。 


1 研究 区 概况 


JA — JE BRU (82° 20'~83°20E, 41°00'~41°40'N ) 


期 为 4 一 10 月 。 据 统计 , 渭 一 库 绿洲 的 棉花 面积 4 
别 占 全 疆 和 阿克苏 地 区 棉花 面积 的 8.56% 和 
38.20% ,产量 分 别 占 8.41% 及 40.34% ,是 新 疆 棉 花 
主 产 区 1。 人 研究 区 及 样 点 分 布 如 图 1 所 示 。 


Sy 


0 10km 图 例 。 


Seabee 


图 1 研究 区 和 样 点 分 布 


Fig. 1 Schematic diagram of the study area 


and Sample distribution 


2 数据 与 方法 


2.1 数据 来 源 与 处 理 

野外 实地 考察 是 遥感 监测 研究 的 重要 组 成 部 
分 ,基于 遥感 影像 分 析 和 解 译 验证 依赖 于 实地 实测 
数据 。 实 验 团队 分 别 于 2018 年 7 月 .2019 年 2 月 、 
2021 年 5 月 进行 了 野外 实地 考察 ,获取 了 778 个 典 
型 地 物 的 样 点 ,其 中 有 532 个 训练 样本 和 246 个 验 
证 样本 ,并 利用 CPS 采集 每 一 个 样 点 的 经 纬度 、 周 


地 处 天 山南 翡 , 塔 里 木 盆地 中 北部 ,属于 新 疆 阿 克 
苏 地 区 ,包括 库 车 市 Ub HE A, RSE TK 
平均 海拔 971 m, 地势 北 高 南 低 , 自 西北 向 东南 倾 
斜 , 是 干旱 与 极端 干旱 区 典型 的 扇形 平原 绿洲 。 年 
平均 气温 10.3 % ,年 降水 量 50.0~66.5 mm ,年 均 蒸发 
量 2000~2092 mm。 作 物 类 型 有 棉花 、 玉 米 小麦. 核 
桃红 束 等 ,其 中 棉花 .果树 .玉米 等 秋收 作物 生长 


围 地 物 分 布 情况 并 记录 了 其 他 属性 ,目的 是 为 了 考 
察 影像 分 类 所 需要 的 各 类 地 物 的 样本 和 不 同 作物 
的 分 布 特征 。 据 实地 考察 和 对 研究 区 的 概况 分 类 
类 型 最 终 确 定 为 棉花 玉米、 果树、 居民 地 水体 和 
其 他 6 种 地 物 。 

因此 ,利用 2018—2020 年 作物 连续 生长 季 (1 
景 /1 月 ) 的 36 景 Sentinel-2 数据 来 构建 植被 指数 时 
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序数 据 ,得 到 每 个 像 元 每 个 时 相 的 植被 指数 变化 信 
ACRI). HERR ISTE SOUP ,部 分 影像 云 
量 超过 10% ,但 这 些 云 主要 分 布 在 北部 山区 ,并 不 
影响 作物 分 类 。 利 用 SNAP 和 ENVI 等 影像 处 理 软 
件 进行 预 处 理 , 包 括 大 气 校正 .几何 校正 . 重 采 样 、 
ROE, 


表 1 遥感 影像 基本 参数 


Tab.1 Basic parameters of remote sensing data 


卫星 名 称 获取 时 间 影像 数量 ”波段 数 空间 分 辨 率 /m 
2018 年 1 一 12 月 12 12 10 

Sentinel-2 2019 年 1 一 12 月 12 12 10 
20204F 1—12 H 12 12 10 


2.2 研究 内 容 

对 Sentinel-2 时 间 序 列 影像 进行 预 处 理 ,构建 
NDVI 和 RENDVLs 时 序数 据 。 通 过 S-G 滤波 对 ND- 
VIRENDVLs 时 序数 据 进行 平滑 . 重 构 并 提取 11 个 
物候 特征 ,利用 袋 外 误差 法 (00B) 对 物候 特征 进行 
特征 重要 性 评价 ,选取 特征 重要 性 得 分 较 高 的 特 
征 , 构 建物 候 特 征 优选 组 合 。 在 此 基础 上 利用 重 构 
后 的 时 序数 据 (NDVI Fit 和 RENDVILs Fit) 物候 特 
{IE (REND Virs; Ph) 、 物 候 特 征 优选 组 合 等 数据 集 作 
为 分 类 特征 数据 集 , 构 建 6 种 不 同 的 分 类 特征 数据 
集 并 采用 RFC 方 法 进行 作物 分 类 及 提取 。 为 了 验 
证 RFC 方 法 的 分 类 精度 ,采用 最 大 似 然 分 类 (MLC) 
方法 与 支持 向 量 机 (SVM ) 分 类 方法 分 别 对 上 述 6 种 
分 类 特征 数据 集 进 行 作物 分 类 及 提取 。 根 据 分 类 
结果 最 佳 特征 组 合 的 分 类 影像 提取 研究 区 棉花 及 
其 他 作物 的 面积 。 
2.3 研究 方法 
2.3.1 植被 指数 时 序数 据 构 建 ”为 了 探究 棉花 在 生 
长 过 程 中 的 变化 ,构建 两 种 监测 作物 生育 期 和 长 势 
规律 的 指数 (NDVI 和 RENDVI)。 将 Sentinel-2 卫星 
红 波 段 B4(665 nm) . 红 边 1 波段 B5(705 nm) 、 红 边 2 
波段 B6(740 nm) 、 红 边 3 波 段 B7(783 nm) 、 近 红外 
波段 B8(843 nm), 按 表 2 人 公式” 计算。 
2.3.2 植被 指数 时 序 重 构 及 物候 特征 参数 提取 本 
研究 对 时 序 植被 指数 进行 拟 合 .平滑 EH ,并 提取 
11 个 物候 特征 参数 ,其 含义 所 如 表 3 所 示 。S-G W 
合法 是 由 Savitzky 和 Golay 提出 的 基于 最 小 二 乘法 
的 卷 积 算法 ,计算 公式 如 下 : 
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表 2 植被 指数 及 计算 公式 
Tab.2 Indices and calculating formulas of vegetation 
特征 指数 全 称 计算 公式 
光谱 特征 ” 归 一 化 植被 指数 (NDVI) (B8-B4)/(B8+B4) 
红 边 特征 ” 红 边 1 归 一 化 植被 指数 (RENDVIxs) (B8-B5)/(B8+B5) 
江 边 2 归 一 化 植被 指数 (RENDVI;w) (B8-B6)/(B8+B6) 
红 边 3 归 一 化 植被 指数 (RENDVILs) (B8-B7)/(B8+B7) 


IN INS 


NS 


E: B4、B5、B6、B7、B8 分 别 为 红 波 段 (665 nm)、 红 边 1 波 段 (705 nm). 
[ 边 2 波段 (740 nm)、 红 边 3 波段 (783 nm)、 近 红外 波段 (843 nm)。 


< 


NS 


表 3 物候 特征 


Tab.3 Phenological characteristics 


物候 特征 寺 征 含义 


生长 季 开 始 ” 左边 NDVI 增 加 到 用 户 定 义 的 拟 合 函 数值 的 时 刻 
生长 季 结 束 ” ”右边 NDVI 减 少 到 用 户 定义 的 拟 合 函数 值 的 时 刻 
生长 季 长 度 ”生长 结束 与 生长 季 开始 的 时 间 差 值 

生长 季 基 值 ” 拟 合 函数 左右 2 部 分 NDVI 最 小 值 的 平均 值 
生长 季 中 期 ” 左边 增加 到 80% 和 右边 降低 到 80% 的 平均 时 间 
end NDVI 最 大 值 

生长 季 振 幅 。 最 大 值 和 基 值 之 间 均 值 的 差 


生长 季 左 导数 “NDVI 增 加 到 左边 振幅 80% 的 时 间 
生长 季 右 导数 ”NDVI 减少 到 右边 振幅 80% 的 时 间 
生长 季 大 积分 从 生长 季 开 始 到 生长 季 结 束 的 区 域 面 


积 


中 (1) 


jtl 


i=-m 


式 中 :六 为 平滑 后 NDVI 值 ;j 为 原始 NDVI 时 间 序 列 
的 序数 ;i 为 任意 一 个 NDVI 时 序数 据 ; 交 ,为 平滑 后 
的 NDVI 的 序数 ;C; 为 从 滤波 窗口 首部 开始 第 i 个 
NDVI 值 的 权 值 ;NV 为 滤波 窗口 大 小 ;m 为 N/2 滤 波 窗 
ODRE”, 

2.3.3 HERAS ”RFC 方法 不 仅 可 以 对 遥感 影 
像 进行 分 类 ,在 特征 集 的 选择 与 优化 中 发 挥 着 重要 
作用 。 从 训练 样本 中 随机 抽取 70% 的 样本 进行 分 
类 ,假设 最 初 的 训练 样本 集 总 有 V 个 样本 ,每 个 样本 
都 有 必 个 特征 。 当 样本 数量 较 大 时 , 约 有 30% 的 样 
本 未 被 抽取 ,这 一 部 分 被 称 为 00B, 可 以 估计 分 类 
精度 ,也 可 以 计算 参与 分 类 的 不 同 特征 的 重要 性 ， 
特征 变量 重要 性 评估 模型 如 下 5 : 


1 Yom, M, 
VI(M,)= Wale 2B) (2) 


式 中 :VI 为 特征 变量 的 重要 性 M HEER HE RE 
征 数 ;4 为 特征 值 ;N 为 生成 的 决策 树 的 棵 数 ;1 为 任 
意 的 决策 树 ;0 为 未 加 入 呢 声 干扰 的 时 刻 ;n 为 加 入 
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噪声 干扰 的 时 刻 ; B” 为 任意 特征 值 M 加 入 噪声 干 
扰 时 第 1 棵 决策 树 的 00B 误 差 ; B。 为 任意 特征 值 
有 未 加 入 噪声 干扰 时 第 : 棵 决策 树 的 OOB 误差 。 
2.3.4 分 类 方法 与 分 类 方案 MLC 是 根据 贝 叶 斯 判 
决 准则 ,在 多 类 判决 中 用 统计 的 方法 建立 判别 函数 
集 , 即 将 遥感 影像 多 波段 数据 的 分 布 作为 多 维 正 态 
分 布 来 构造 判别 分 类 函数 ”。 

L(x) =p(Cilx) =p(xIC,) x p(C,)/p(x) (3) 
式 中 : L(x) 为 目标 函数 ;x 为 事件 ;i 为 任意 事件 ;C; 
为 任意 事件 的 类 别 ; P(C) 为 已 知 * 事 件 发 生 了 ， 
那么 它 属 于 类 别 C; 的 概率 ; p(xIC,) 为 类 别 C, 对 应 
的 x 的 概率 ; p(C,) 为 类 别 C; 发 生 的 概率 ; p(x) 为 事 
件 x 发 生 的 概率 。 

SVM 基于 通过 最 小 化 经 验 风 险 和 置信 区 间 来 
最 小 化 结构 风险 的 统计 理论 。 将 神经 网 络 结构 选 
择 问 题 转化 为 比较 容易 的 核 函 数 选择 问题 ,有 很 好 
的 优势 ”。 


f(x)=(wxx)+b> 1 (4) 
SO fx) a El tor eB BM x 为 向 量 之 间 的 内 积 ;w 为 权 
向 量 九 为 分 类 冰 值 ,决定 超 平面 距离 原点 的 距离 。 

RFC 方 法 的 主要 思路 是 基于 遥感 数据 及 特征 

变量 基础 上 ,首先 对 数据 进行 随机 重 采样 ,然后 构 
建 多 个 决策 树 ,最 后 采用 多 决策 树 投票 的 方式 确定 
数据 类 别 归 属 *。 

Gini(A) = > p,(1-p,) (5) 
式 中 :Cini(4) 为 4 集合 的 基尼 指数 ;有 为 训练 样本 中 
样本 种 类 数 ;b 为 随机 选中 的 样本 类 别 ;p, 为 集合 A 
中 随机 选中 的 样本 类 别 5 的 概率 ;(1- p,) 为 样本 被 
分 错 的 概率 。 


表 4 用 于 作物 分 类 的 数据 组 合 类 型 特征 
Tab. 4 Combination characteristics of data types used 


in crop classification 


方案 特征 集 波段 数目 
A 重 构 后 的 NDVI 时 序数 据 (NDVI Fit) 36 
Bo 重 构 后 的 RENDVIs 时 序数 据 (RENDVLs Fit) 36 
C ， 重 构 后 的 RENDVLs 11 个 物候 特征 (RENDVILs Ph) 11 
D ”物候 特征 优选 组 合 6 
E ” 重 构 后 的 RENDVIxs 时 序数 据 +11 个 物候 特征 47 
(RENDVLs Fit+RENDVLs Ph) 
F ” 重 构 后 的 RENDVIxs 时 序数 据 + 物候 特征 优选 组 合 42 


利用 重 构 后 的 NDVI 时 序数 据 (NDVI Fit) ŒE} 
JE FY REND VIs Yt PSHE (REND Vines Fit) 物候 特征 
(RENDV Iss Ph) 物候 特征 优选 组 合 4 种 数据 构建 6 
种 不 同 的 分 类 特征 数据 集 ( 表 4)。 


3 结果 与 分 析 


3.1 植被 指数 随时 间 变 化 特征 

作物 的 生长 规律 是 播种 .出苗 .抽雄 成熟 和 采 
摘 过 程 ” ,图 2 表示 人 研究 区 作物 生长 周期 中 植被 指 
数 的 变化 ,总 体 上 看 4 种 植被 指数 呈 先 上 升 达到 峰 
值 后 下 降 的 趋势 。 从 图 2a 可 以 看 出 ,3 种 作物 的 
NDVI 曲 线 较为 相似 ,生长 季 同 时 开始 ,在 生长 季 长 
度 和 生长 季 结 束 期 有 较 好 的 区 分 性 。 在 NDVI 时 序 
曲线 中 ,3 种 作物 的 峰值 均 低 于 0.8, 红 边 波段 加 入 
之 后 ,所 有 作物 的 RENDVI 曲线 的 峰值 均 高 于 0.8， 
反映 出 较 好 的 区 分 效果 (图 2b~d)。 这 是 因为 红 边 
波段 (705~783 nm) 更 深入 于 作物 冠 层 和 叶片 ,对 冠 
层 的 微小 变化 和 衰老 更 加 敏感 。 其 中 ,在 REND- 
VLs 时 间 序 列 中 ,作物 的 波峰 值 较 高 , 约 达 到 0.9。 
作物 曲线 之 间 的 分 离 较 好 ,每 种 作物 的 物候 规律 更 加 
清晰 和 直观 。 这 是 因为 构成 RENDVLs 的 B7(783 
nm) 波 段 与 B8 波 段 更 接近 ,从 而 能 够 更 好 地 表达 植 
物 的 物候 信息 。 进 一 步 分 析 图 2d 可 以 看 出 ,棉花 的 
平均 生长 期 约 在 第 180 d 左 右 , NDVI 值 从 第 120~ 
140 d 苗 期 开始 升 高 ,在 第 230~250 d 花 铃 期 达到 峰 
值 ,在 第 270~280 d 棉 花 停 止 生长 时 下 降 , 变 化 特征 
及 其 明显 。 而 玉米 和 果树 的 生育 期 为 130~150 d Ze 
$i ,第 210~240 d 达 到 最 大 值 , 易 与 棉花 区 分 。 
此 ,最 终 确 定 利 用 NDVI 和 RENDVLs 时 间 序 列 数据 
进行 下 一 步 平 请 . 重 构 研 究 。 
3.2 时 序数 据 重 构 

在 提取 物候 特征 之 前 ,需要 用 滤波 函数 拟 合 重 
构 植 被 指数 时 序 影像 ,最 大 程度 地 减少 噪声 的 影 
响 ,为 后 期 分 类 提供 准确 的 数据 。 图 3 是 纯 像 元 滤 
波 处 理 前 后 NDVI 和 RENDVLs 时 间 序 列 对 比 曲 
线 。 结 果 表 明 ,经 过 S-G 滤波 拟 合 后 ,两 种 时 序曲 线 
的 噪音 和 异常 值 明显 降低 ,曲线 更 加 平滑 。 平 滑 后 
的 曲线 与 研究 区 3 种 作物 生长 周期 基本 一 致 ,峰值 
和 低谷 期 与 作物 的 生长 感 期 及 收割 期 完全 吻合 。 
3.3 物候 特征 提取 

作物 的 物候 特征 指标 是 分 类 的 关键 ,NDVI 和 
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(a) NDVI (b) RENDVIos 
Lop iie e 玉米 -~ 果树 Lorp 一- 棉花 e 玉米 -果树 
一 - 居民 地 … 水 域 一 居民 地 e 水 域 


-0.2 
0 3 6 9 12 15 18 21 24 27 30 33 36 


月 数 


(c) RENDV hs 


一 棉花 
a 一 - 居民 地 oo 


-0.2 
0 3 6 9 12 15 18 21 24 27 30 33 36 


月 数 


ces 玉米 -一 果树 
水 域 1.0 


RENDV Ios 


(d) RENDV s 


RENDV Is; 


一 棉花 


0 3 6 9 12 15 18 21 24 27 30 33 36 


月 数 


coe 玉米 -果树 


0 3 6 9 12 15 18 21 24 27 30 33 36 


月 数 


{¥ : NDVI, RENDV Ins RENDVILo RENDVLs 依 次 为 归 一 化 植被 指数 . 红 边 1 归 一 化 植被 指数 、 红 边 2 归 一 化 植被 指数 、 红 边 3 归 一 化 植被 指数 。 


1.0 


(a) NDVI( 棉 花 ) 
一 - 重 构 前 — 重 构 后 


RENDVhxs 


1.0 


0.8 
0.6 
0.4 
0.2 
0.0 


3 6 9 12151821 2427303336 
月 数 


(d) RENDVDs( 棉 花 ) 
一 - 重 构 前 一 - 重 构 后 


3 6 9 121518212427303336 
月 数 


图 2 不 同 数据 典型 地 物 曲线 
Fig. 2 Curves of typical ground object 


(b) NDVI( 果 树 ) 
lop 一- 重 构 前 一 - 重 构 后 
0.8 


0.6 


NDVI 
NDVI 


0.4 h 


0.2 


0.0 - à 
3 6 9 121518212427303336 


月 数 


(e) RENDVIss( 果 树 ) 
1.0 ”一 - 重 构 前 一 - 重 构 后 


36 9121518212427303336 
月 数 


0.6 
0.4 


RENDVJs 


0.2 上 
0.0 


(c) NDVI( 玉 米 ) 
1.0「 _. 重 构 前 一 - 重 构 后 ， 


3 691215$18212427303336 


月 数 


(DRENDVTs( 玉 米 ) 
1.0 -— 重 构 前 一 - 重 构 后 


0.8 
0.6 
0.4 


0.2 


3 6 9 121518212427303336 
月 数 


3 S-G 滤 波 重 构 前 后 作物 NDVI 和 RENDVLs 时 序曲 线 
Fig.3 Crop NDVI and RENDVJLs time curves before and after S-G filtering 
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(a) NDVI 物 候 特征 组 合 1 (b) NDVI 物 候 特征 组 合 2 (c) NDVI 物 候 特征 组 合 3 
35 r —— ME EK -= 果树 1.0 p 一 棉花 -… 玉米 -~ 果树 10 p 一 棉花 一 玉米 -~ 果树 
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物候 特征 物候 特征 物候 特征 
(d) RENDVIs 物 候 特 征 组 合 1 (e) RENDVJs 物 候 特 征 组 合 2 (p RENDVTs 物 候 特 征 组 合 3 
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0 
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注 : 将 11 个 物候 特征 按照 取 值 范 


围 分 成 3 组 以 便 进行 对 比分 析 。 


图 4 NDVI 和 RENDVLs 同 一 作物 的 不 同 物候 特征 值 
Fig. 4 Different phenological eigenvalues of the same crop in NDVI and RENDV Ls 


RENDVLs 拟 合 中 每 种 作物 在 生长 季 的 物候 指标 曲 
线 如 图 4 所 示 。 从 图 4a 与 图 4d 生 长 季 开 始 和 生长 
季 结 束 曲 线 来 看 ,NDVI EG RENDVIw; 曲 线 起 伏 程度 
较 小 ,相对 平缓 。 在 生长 季 开 始 不 同 作物 在 REND- 
VLs 上 体现 的 更 分 散 ,有 区 分 性 。 生 长 季 结 束 指标 
显示 RENDVLs 出 现 不 同 作物 集聚 为 2 组 。 从 图 4b 
和 4e 生 长 季 基 值 UA PRR KA BEAR Ede 
3 个 物候 指标 值 来 看 ,RENDVLs 比 NDVI 在 不 同 作 
物 的 物候 指标 有 较 大 差异 。 拟 合 函 数 最 大 值 物 候 
指标 显示 ,RENDVLs 的 波动 幅度 以 及 差别 要 大 于 
NDVI。RENDVlIxs 对 作物 更 敏感 ,棉花 与 其 他 作物 
的 差别 比较 大 ,最 容易 识别 ;从 图 4c 和 4f 生 长 季 长 
度 、 大 积分 、 小 积分 物候 指标 中 可 以 看 出 RENDVl 
比 NDVI 波 动 幅 度 大 ,在 指标 值 方面 RENDVLs 比 
NDVI 整 体高 。 生 长 季 长 度 指 标 处 NDVI 出 现 轻微 
的 集聚 ,RENDVIL。s 相 对 来 说 更 分 散 , 说 明 不 同 作 物 


在 生长 季 长 度 比较 容易 区 分 。 因 此 最 终 提取 重 构 
后 RENDVLs 时 序数 据 的 11 个 物候 特征 影像 并 参与 
到 下 一 步 的 分 类 实验 。 

SEF S-C 滤波 拟 合 重建 后 的 RENDVIs 时 间 序 
列 数据 集 , 选 取 了 11 个 关键 季节 性 物候 特征 的 指标 
影像 (图 5)。 可 以 看 出 生长 季 结 束 期 的 0 值 区 域 波 
动 较 少 ,在 拟 合 函 数 最 大 值 和 生长 季 振幅 的 特征 值 
主要 集中 在 研究 区 北部 和 渭 干 河 一 库 车 河 两 岸 ,在 
生长 季 左 导数 和 右 导 数 的 0 值 区 域 分 布 较 广 。 
3.4 特征 重要 性 评价 

利用 RFC 方 法 的 00B 法 ,对 上 述 提取 的 11 个 
物候 特征 进行 重要 性 评估 ,特征 的 重要 性 得 分 如 图 
6。 生 长 季 拟 合 函 数 最 大 值 的 重要 性 得 分 最 高 > 
1.43 ,对 接 下 来 的 分 类 及 信息 提取 的 贡献 率 最 大 ;其 
次 为 生长 季 长 度 (1.40); 第 三 为 生长 季 振 幅 (1.23); 
生长 季 结 束 为 1.16; 生 长 季 大 积分 .生长 季 小 积分 的 
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(a) 生长 季 开始 (b) 生长 季 结束 (©) 生长 季 长 度 (d) 生长 季 基 值 


Er 2 


(e) 生长 季 中 期 (f) 拟 合 函 数 最 大 值 


j Riin N 0 2 


(i) 生长 季 右 导数 


0 2 Him. 2 


mi 0 2 


(g) 生长 季 振 幅 


0 2 


O 生长 季 大 积分 


Zoin. PNN o 2 


20k 0 2 20km M 


(h) 生长 季 左 导数 


CT 0 2 2 AR 


(k) 生长 季 小 积分 


20 km CP 


图 5 物候 特征 影像 


Fig. 3 Phenological feature image 


重要 性 得 分 分 别 为 1.02 1.01; 其 余 物 候 特 征 的 重要 
性 得 分 均 小 于 1。 因 此 ,选取 前 6 个 重要 性 得 分 较 高 
的 特征 组 成 一 个 优选 特征 数据 集 ,参与 到 下 一 步 的 
分 类 实验 。 
3.5 分 类 结果 及 精度 验证 

3 种 分 类 方法 对 6 种 分 类 特征 方案 的 分 类 总 体 
精度 从 高 到 低 依 次 为 :F 方 案 >C 方 案 >E 方 案 >B 方 案 
>D 方 案 >A 方 案 。MLC SVM 和 RFC 3 种 方法 中 分 类 
效果 最 好 的 特征 组 合 均 为 了 方案 (RENDVLs Fit+ 物 


候 特 征 优选 组 合 ) ,总 体 精 度 和 Kappa 系 数 分 别 达 到 
T 82.60% .88.40% ,92.20% Ail 0.82 .0.87 ,0.92( £17). 
RFC 方 法 中 ,对 比 A 方 案 (NDVI Fit) Al B AR 
(RENDVLs Fit) , B 方 案 分 类 精度 提高 了 1.30%， 
Kappa 系数 提高 了 0.02, 说 明 红 边 波段 的 参与 提高 
了 分 类 精度 ;对 比 C 方 案 (RENDVLs Ph) 与 下 方案 
(RENDV bs Fit+ RENDVIzs Ph) ,上 方案 的 总 体 精 度 
和 Kappa 系 数 提高 了 3.40% 和 0.04 ,说 明 物 候 特征 明 
显 提高 了 分 类 精度 ;对 比 C 方 案 和 D 方 案 ( 物 候 特 征 
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图 6 RENDVIs 时 序 物 候 特征 变量 的 重要 性 排序 
Fig. 6 Importance ordering of feature variables of 


RENDVLs time-series phenology 


优选 组 合 ) ,D 方 案 的 总 体 精度 和 Kappa 系 数 提高 了 
2.10% 和 0.03 ,说 明 分 类 精度 不 会 随 着 特征 波段 的 
增加 而 增加 ;对 比 下 方案 和 FF 方案, 上 方案 总 体 精 度 
和 Kappa 系数 提高 了 3.60% 和 0.05 ,关键 的 特征 信息 
避免 交叉 见 余 信息 对 棉花 提取 的 干扰 ,使 所 有 类 型 
的 生产 者 精度 和 用 户 精 度 都 有 较 大 程度 的 改善 。 

分 别 对 6 种 特征 数据 集 ,3 种 不 同 的 分 类 方法 所 
获取 的 棉花 分 类 结果 计算 混淆 矩阵 ,具体 结果 见 表 5。 

MLC 方 法 分 类 结果 从 图 8a~f 中 可 以 看 出 ,图 像 
分 类 效果 整体 上 比较 细碎 ,棉花 的 分 类 效果 较 差 ， 
绿洲 边缘 地 区 、 东 部 和 西部 的 棉花 种 植 区 域 明显 稀 
少 。 玉 米 几 乎 没有 被 识别 出 来 ,大 部 分 玉米 误 分 为 
居民 地 。 果 树 沿 着 消 干 河 一 库 车 河流 域 与 居民 地 
交错 分 布 ,分 类 面积 过 多 ,有 误 分 的 情况 。 

SVM 分 类 结果 ,从 图 8g~1 中 可 以 看 出 ,没有 太 


RFC 


7 
A 
| 


注 :MLC 为 最 大 似 然 分 类 ;SVM 为 支持 向 量 机 ;RFC 为 随机 森林 分 类 。 下 同 。 


图 7 3 种 分 类 方法 不 同 分 类 方案 精度 雷达 图 


Fig.7 Precision radar map of three classification methods and different classification plans 


表 5 3 种 分 类 方法 不 同 分 类 方案 棉花 分 类 精度 比较 


Tab. 5 Comparison of cotton classification accuracy of three classification methods and different plans 1% 

分 类 方法 分 类 精度 A 方 案 B 方 案 CHR D 方 案 LER FUR 
MLC 制图 精度 79.92 82.06 79.36 82.89 85.05 86.66 
用 户 精 度 71.70 78.39 76.54 78.51 81.92 80.59 

SVM 制图 精度 83.01 85.03 86.11 90.09 89.33 90.88 
用 户 精 度 76.22 78.21 79.55 82.56 84.17 88.44 

RFC 制图 精度 87.14 89.07 90.54 91.07 87.09 88.89 
用 户 精 度 79.66 82.32 83.38 85.41 89.36 94.12 


注 :MLC 为 最 大 似 然 分 类 ;SVM 为 支持 向 量 机 ;RFC 为 随机 森林 分 类 。 下 同 。 
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(a) MLC (A 方 案 ) 


(b) MLC (B 方 案 ) (c) MLC (C 方 案 ) 
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(d) MLC (D 方 案 ) 
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(e) MLC (E 方 案 ) 


j 
~ 广 “ 
TK i 
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图 8 不 同 数据 集 分 类 结果 对 比 


Fig.8 Comparison of different dataset classification results 


过 细碎 的 部 分 ,棉花 成 片 状 分 布 在 绿洲 ， 概 盐 ” 现 象 
明显 减少 。 玉 米 在 研究 区 中 部 交错 分 布 ,果树 沿 着 渭 
干 河 一 库 车 河流 域 与 居民 地 交错 分 布 。 人 研究 区 的 建 
筑 分 布 较 稀 玻 且 散落 ,东北 部 分 为 较 大 建筑 集中 区 ， 
但 是 与 MLC 方 法 分 类 相 比 分 类 结果 比较 精确 。 

RFC 分 类 结果 ,从 图 8m~r 中 可 以 看 出 ,与 上 述 
两 种 分 类 结果 相 比 效果 比较 理想 。 棉 花 在 研究 区 
由 内 而 外 大 面积 种 植 , 主 要 在 南部 和 西南 部 以 及 塔 
里 木 河 两 岸 呈 片 状 分 布 ,因此 棉花 的 识别 效果 是 最 
好 的 。 有 些 玉米 分 布 在 研究 区 东部 ,大 部 分 交错 分 
布 在 研究 区 中 部 。 果 树 大 部 分 沿 着 2 条 河流 域 与 居 
民 地 交错 分 布 ,研究 区 北部 也 有 大 量 的 种 植 。 由 于 
多 种 作物 套种 等 复杂 的 种 植 方式 ,使 得 分 类 仍然 存 
在 错 分 和 漏 分 现象 。 该 分 类 结果 中 ,居民 地 的 识别 
也 有 显著 的 提高 ,主要 分 布 在 库 车 市 .新 和 县 和 沙 
雅 县 人 口 集中 分 布 的 区 域 , 误 分 情况 明显 减少 。 

为 了 突出 不 同 分 类 方法 的 分 类 效果 ,在 3 种 分 
类 方法 中 分 别 选 取 F 方 案 对 应 的 3 个 子 区 域 分 类 结 
果 与 原始 影像 进行 对 比分 析 ( 图 9)。 样 地 1 的 3 种 


方法 分 类 结果 局 部 细节 图 (图 9b~d) 可 以 看 出 ,MLC 
方法 把 裸 地 错 分 为 居民 地 ,SVM 分 类 方法 中 裸 地 错 
分 为 水 体 ; 样 地 2 的 3 种 方法 分 类 结果 局 部 细节 图 
(图 9f~h) 可 以 看 出 ,MLC 方 法 裸 地 错 分 为 玉米 ， 
SVM 分 类 方法 中 裸 地 错 分 为 居民 地 ,棉花 分 类 面积 
明显 比 RFC 方 法 少 ; 样 地 3 的 3 种 方法 分 类 结果 局 
部 细节 图 (图 9j~1) 可 以 看 出 ,MLC 方 法 把 裸 地 错 分 
为 居民 地 ,SVM 分 类 方法 把 裸 地 错 分 为 点 状 分 散 地 
水 体 ,RFC 方 法 效果 最 好 。 因 此 总 结 出 ,RFC 方 法 最 
适合 种 植 模式 复杂 的 人 研究 区 ,能 够 有 效 地 识别 不 同 
的 作物 ,并 得 到 高 精度 的 提取 。 

根据 RFC 方 法 F 方 案 分 类 结果 ,提取 研究 区 棉 
TE .果树 玉米 3 种 作物 的 面积 。 研 究 区 主要 作物 为 
棉花 ,种 植 面 积 约 为 3424 km , 占 研 究 区 总 面积 的 
24.67% ; 其 次 是 果园 ,种 植 面 积 约 为 1216 km’, OF 
究 区 总 面积 的 8.76% 5 玉米 的 种 植 面 积 最 少 , 约 为 
733 km’ , 仅 占 人 研究 区 总 面积 5.28%。 


4 讨论 


本 研究 分 析 了 Sentinel-2 红 边 归 一 化 植被 指数 
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(a) 样 地 1( 原 图 ) (b) 样 地 1(MLC) 


(e) 样 地 2( 原 图 ) 


(i) 样 地 3( 原 图 ) (j) 样 地 3(MLC) 


GY 


(c) 样 地 1(SVMD 


(d) 样 地 I(RFC) 


图 例 ”典型 地 物 mE Se 玉米 居民 地 KE 其 他 


注 : 黑 框 表示 3 种 分 类 方法 的 分 类 结果 出 现 差异 的 区 域 。 
图 9 3 种 分 类 方法 的 分 类 结果 局 部 图 


Fig. 9 Partial graph of classification results of three different classification methods 


时 序数 据 和 物候 特征 对 作物 分 类 精度 的 影响 及 特 
征 的 重要 性 。 利 用 RFC 方法 对 棉花 分 布 识别 与 种 
植 面积 提取 ,研究 结果 在 一 定 程度 上 解决 了 以 往 研 
究 ” 中 大 尺度 遥感 影像 作物 识别 过 程 中 混合 像 元 
众多 和 特征 变量 不 足 而 造成 的 分 类 精度 较 低 的 问 
题 。 同 时 为 时 序 Sentinel-2 数 据 在 干旱 区 作物 的 识 
别 及 面积 提取 研究 提供 了 一 定 的 参考 。 

本 研究 主要 利用 新 数据 源 、 特 征 变 量 的 引入 和 
特征 优选 等 方法 验证 了 RFC 方法 对 作物 分 类 和 信 
息 提 取 的 可 行 性 。 近 年 来 基于 物候 特征 对 多 时 相 
遥感 影像 在 农作物 的 信息 提取 中 得 到 了 广泛 应 用 ， 
如 MODIS Landsat 等 数据 构建 的 NDVI、EVI 时 序曲 
线 结合 作物 的 季节 性 特征 , 较 好 地 提取 了 甘 芒 .水稻 
等 作物 的 分 布 和 面积 信息 ,精度 均 比较 理想 ”。 但 
是 对 于 地 块 破碎 ,种 植 类 型 比较 复杂 的 区 域 ,Land- 
sat 和 MODIS 数据 难以 解决 混合 像 元 的 问题 ,而且 仅 
靠 单一 的 植被 指数 难以 达到 精确 分 类 的 目的 。 本 


文 利用 长 时 间 序 列 Sentinel-2 影 像 不 仅 提 高 遥感 影 
像 的 分 辨 率 , 同 时 为 棉花 识别 提供 了 敏感 波段 和 有 
效 特征 ,在 时 间 和 空间 以 及 特征 量 方 面 扩 充 作物 遥 
感 监测 技术 与 方法 体系 ”。 男 外 ,本 文 利用 S-G 滤 
波 法 重建 的 植被 指数 时 序数 据 消 除 原 数 据 存 在 的 
噪音 和 异常 值 的 干扰 ,提高 数据 质量 的 同时 保持 农 
作物 物候 信息 的 真实 性 ”。 基 于 00B 法 的 物候 特 
征 优选 避免 元 余 信 息 对 棉花 识别 与 提取 的 干扰 ,使 
分 类 精度 得 到 一 定 程 度 的 提升 ”。 最 终 基 于 重 构 
后 的 红 边 植被 指数 时 序数 据 和 物候 特征 优选 组 合 
的 RFC 方 法 精度 达到 92.20%。 人 研究 区 棉花 种 植 面 
积 向 外 延伸 ,在 南部 、 西 南部 和 塔里木 河 两 岸 呈 片 
状 分 布 ; 但 一 些 套种 模式 比较 复杂 的 区 域 存在 漏 
分 、. 误 分 等 现象 ,作物 识别 精度 有 待 提高。 

虽然 本 文 的 研究 方法 和 思路 ,为 克服 大 范围 的 
干旱 区 农作物 种 植 面积 提取 所 面临 的 空间 分 辩 率 
和 参与 特征 种 类 不 足 等 问题 提供 一 定 的 参考 ,但 也 
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存在 进一步 探讨 的 问题 。Sentinel 系 列 卫星 的 Senti- 
nel-1 雷达 数据 有 超 强 的 穿 透 性 ,不 受 云 量 和 天 气 的 
影响 ,与 Sentinel-2 光学 数据 具有 更 好 地 融合 优 
势 。 已 有 学 者 利用 基于 多 时 相 双 极 化 SAR 数据 , 根 
据 研究 区 作物 的 物候 特征 和 不 同 作物 的 生长 期 后 
回 散 射 系 数 ,提取 了 研究 区 棉花 种 植 面 积 ,分 类 精 
度 达 到 了 90.88%”。 鉴 于 此 ,以 后 研究 的 重点 在 于 
利用 Sentinel 多 源 遥 感 数据 的 综合 应 用 特征 优选 
方法 构建 和 智能 化 分 类 方法 建立 ,从 而 进一步 提高 
分 类 精度 。 


5 结论 


(1) 从 Sentinel-2 NDVI 和 RENDVIL。 植 被 指数 
的 棉花 生育 期 变化 规律 可 以 看 出 ,棉花 NDVI 指 数 
与 RENDVLs 变 化 趋势 较为 一 致 ,在 5 月 ( 苗 期 ) 到 8 
月 初 (开花 盛 期 ) 有 明显 的 上 升 趋势 ,在 8 月 末 至 9 
H CER H ) 达 到 峰值 。 相 比 NDVI 时 序曲 线 ,加 入 
红 边 波段 后 的 RENDVLs 时 序曲 线 峰 值 从 0.7 提高 
到 0.9, 易 与 相互 区 分 ,体现 出 更 佳 的 区 分 效果 。 

(2) 利用 00B 法 对 RENDVLs 的 11 个 物候 特征 
进行 重要 性 评价 ,生长 季 拟 合 函 数 最 大 值 的 重要 性 
最 高 ,为 1.43 ,对 分 类 及 信息 提取 的 贡献 率 最 大 。 其 
次 为 生长 季 长 度 (1.40) ;第 三 为 生长 季 振 幅 (1.23 ) ; 
生长 季 结 束 .生长 季 大 积分 .生长 季 小 积分 的 重要 
性 分 别 为 1.16、1.02、1.01。 

(3) RFC 方 法 对 F 方 案 的 分 类 精度 最 佳 。 总 体 
精度 和 Kappa 系数 分 别 为 92.20% 和 0.92。 

(4) 根据 RFC 方 法 F 方 案 的 分 类 结果 ,提取 了 
人 研究 区 内 棉花 的 种 植 面积 , 约 为 3424 km , 占 研究 区 
总 面积 的 24.67%。 
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Extraction of cotton planting area based on Sentinel—2 time series data and 
phenological characteristics 


Mihray MOYIDIN', Mamat SAWUT'™, LI Jinzhao’ 
(1. College of Geography and Remote Sensing Science, Xinjiang University, Urumqi 830046, Xinjiang, China; 2. Xinjiang Key 
Laboratory of Oasis Ecology, Xinjiang University, Urumqi 830046, Xinjiang, China; 3. Key Laboratory of Smart City and 
Environment Modelling of Higher Education Institute, Xinjiang University, Urumqi 830046, Xinjiang, China) 


Abstract: Cotton is an important economic crop in China and is cultivated on a large scale in Xinjiang. The 
timely and accurate acquisition of cotton planting areas is significant to agricultural policy formulation and 
economic development. This study takes the Ugan River- Kuga River delta oasis cotton as the main research 
object and uses the Sentinel-2 data of 36 scenes from 2018 to 2020 (1 scene/month) to construct a normalized 
vegetation index (NDVI) and red-edge normalized vegetation index (RENDVI) time-series data; The Savitzky- 
Golay filtering method is used to smooth and reconstruct the time-series data, and 11 phenological features are 
extracted. The out-of-bag method is used to optimize the 11 phenological features. Time-series data NDVI Fit and 
RENDVI,; Fit, phenological feature RENDVI;;; Ph, and phenological feature optimization were combined to 
construct six different feature datasets, which were classified and extracted by random forest classification (RFC). 
The maximum likelihood and support vector machine were used to verify the classification effect. The results are 
as follows: (1) The changing trends of NDVI and RENDVI,;; time-series data are relatively consistent. Cotton has 
an obvious upward trend from May (seedling stage) to early August (blooming stage) and reaches a peak from the 
end of August to September (flowering and boll stage). Compared with NDVI, the peak value of the RENDVI;s3 
time-series curve composed of the red-edge band is increased from 0.7 to 0.9, and the cotton discrimination effect 
is better. (2) Among the 11 phenological features, the maximum value of the fitting function, the length of the 
growing season, the amplitude of the growing season, the end of the growing season, the large integral of the 
growing season, and the small integral of the growing season contributed the most to the classification effect, 
with importance scores of 1.43, 1.40, 1.23, 1.16, 1.02, and 1.01, respectively. (3) The RFC method has the best 
classification accuracy for the feature dataset (RENDVI,;; Fit + phenological feature optimal combination). The 
overall accuracy and Kappa coefficient are 92.20% and 0.92, respectively. (4) The cotton classification accuracy 
in the study area reached 91.02%, and the planting area was approximately 3424 km’, accounting for 24.67% of 
the total area of the study area. 

Key words: NDVI time-series; RENDVI time-series; phenological characteristics; out-of-bag error method; random 


forest classification 


